喜报|科大讯飞包揽CHiME-4国际多通道语音分离和识别大赛三项冠军
美国当地时间2016年9月13日,国际多通道语音分离和识别大赛(CHiME)组委会在美国旧金山Google公司揭晓了第四届CHiME-4的大赛结果:科大讯飞包揽了本届CHiME赛事全部三个项目的最好成绩。三个项目分别是六麦克风、双麦克风和单麦克风场景下的语音分离和英文识别任务。本次CHiME大赛夺冠,再次证明了科大讯飞在语音识别和多麦克风阵列语音信号处理领域内国际顶尖的技术实力,也表明科大讯飞在中文语音识别系统保持绝对领先的同时,其英语语音识别系统同样达到国际领先水平。
CHiME
CHiME(Computational Hearing in Multisource Environments)比赛始办于2011年,由法国计算机科学与自动化研究所、英国谢菲尔德大学、美国三菱电子研究实验室等知名研究机构所发起,比赛的目的是希望学术界和工业届针对高噪声和混响等现象影响下的实际场景提出全新的语音识别解决方案,以进一步提升语音识别的实用性和普适性,属于国际语音识别评测中的高难度比赛。目前CHiME比赛已经举办四届,成为业界影响力最大、参赛队伍最多、水平最高的多通道噪声鲁棒性语音识别比赛。往届的比参赛队伍包括了英国剑桥大学、美国卡内基梅隆大学、日本的NTT、德国的RWTH亚琛大学等知名研究机构,国内也有清华大学、中科院声学所、上海交通大学等知名高校和研究所参与。作为本届大赛承办方,Google也安排相关人员参与了比赛。
科大讯飞今年首次参加该项赛事,通过和中国科学技术大学杜俊教授团队、西北工业大学陈景东教授、佐治亚理工学院李锦辉教授等国内外知名专家的深入合作和讨论,斩获全部三个项目的桂冠并大幅刷新了各项目的历史最好记录。科大讯飞在六麦克风场景下创造的2.24%的词错误率纪录,得到了大赛主办方的高度赞扬,其认为在基于多通道中小词汇规模的复杂场景语音识别任务上,科大讯飞的系统已经给出了接近完美的解决方案。这也是科大讯飞继在语音合成、说话人识别、语种识别、机器翻译、认知智能等领域国际评测获奖后的另一崭新成就。
以下为ChiME-4国际大赛三个项目的详细结果(词错误率越低,说明系统性能越好):
↓↓↓ 想了解更多比赛 请戳阅读原文
文/研究院 编/ 王十二 图/ 宝丁黄